Enrutamiento Dinámico Consciente del Contexto Eficiente en Energía para Inferencia LLM de Múltiples Modelos Mejora la eficiencia energética con enrutamiento dinámico para inferencia en modelos de lenguaje profundo. 2026-03-02 · 2 min